Model Selection

Quantization Optimization

# Quantization Optimization

Gemma 2 9b It Abliterated GGUF

A quantized version based on Gemma 2.9B, optimized using llama.cpp, suitable for running in LM Studio.

Large Language Model English

Gemma 3 12B It Qat GGUF

Gemma 3 12B IT is a large language model developed by Google, supporting multimodal input and long-context processing.

lmstudio-community

Elastic Llama 3.1 8B Instruct

An elastically optimized version of Meta-Llama-3.1-8B-Instruct, offering model variants with different speed and precision levels, suitable for self-deployment scenarios.

Large Language Model

Qwen Ai Research Qa Q4 K M.gguf

A Q&A model specifically designed for answering research-oriented AI questions, optimized with Q4_K_M quantization format to achieve efficient reasoning while maintaining high-quality responses.

Large Language Model English

Llava 1.6 Mistral 7b Gguf

LLaVA is an open-source multimodal chatbot, trained by fine-tuning LLM on multimodal instruction-following data. This version is the GGUF quantized version, offering multiple quantization options.

Multilingual E5 Small Optimized

This is the quantized version of multilingual-e5-small, optimized for inference performance through layer-wise quantization while retaining most of the original model's quality.

Text Embedding Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase